#pragma once
#include "cuda_utils_my.h"

#define BLOCK_SIZE_16 16

// 计算横竖各切多少次，最后不足一个window尺寸的crop会被舍弃
void calcNumCrops(int src_h, int src_w, int win_h, int win_w, double ratio_h, double ratio_w, int& num_h, int& num_w);

/*
功能：将一张巨大的图片，使用滑动窗口的形式切成许多小图
win_hw指切出的图片尺寸，ratio_wh指切完之后移动步长占win_hw的比例
*/
cudaError_t cuSlideWinCropImg_launch(uint8_t* src, uint8_t* dst, int src_h, int src_w, int win_h, int win_w, double ratio_h, double ratio_w, int num_h, int num_w, cudaStream_t stream);
